Die Document Suite - XML-basierte Sprachverarbeitung als Basistechnologie für das 'Semantic Web'
نویسندگان
چکیده
Die ‘Document Suite’ ist eine Sammlung von Werkzeugen für die verschiedenen Aufgaben beim Erschließen der Inhalte von elektronisch verfügbaren Dokumenten aus dem WWW oder aus anderen Dokumentbeständen. Bei ihrer Konzeption und Realisierung wurde konsequent darauf gesetzt, die Vorteile von XML und die der zugehörigen Formalismen und Werkzeuge auszunutzen: alle Module der ‘Document Suite’ erwarten XML-Dokumente als Eingabe und liefern ihre Resultate in XML-Format. Desweiteren werden alle Ressourcen (z.B. Lexika, Grammatikregeln, semantische Zuordnungen, Topic Maps, ..) einheitlich in XML kodiert.
منابع مشابه
CLab - eine web-basierte interaktive Lernplattform für Studierende der Computerlinguistik
Inhaltlich lässt sich das CLab als eine Sammlung von thematisch selbstständigen Modulen beschreiben zu Themen wie „Reguläre Ausdrücke“, „Tokenisierung“, „Chunking“ oder „Satzähnlichkeit“. Diese Module werden Lerneinheiten genannt. Jede Lerneinheit basiert auf einem Lehrtext (PDF), welcher die inhaltliche Grundlage bildet. Er kann ausgedruckt, durchgearbeitet und leicht durchsucht werden. Letzte...
متن کاملModulare Spezifikation und Steuerung von Dialogen in web-baiserten Anwendungen
Die Benutzerfreundlichkeit von Web-Anwendungen leidet häufig unter der fehlenden Unterstützung hierarchischer Dialogsequenzen, an die Benutzer sich während der Arbeit mit fensterbasierten Benutzeroberflächen und ihren hierarchisch strukturierten Dialogfenstern bereits gewöhnt haben. Für Multikanal-Anwendungen liegt eine zusätzliche Herausforderung darin, die geräteunabhängige Geschäftslogik mit...
متن کاملProzessmodell-basierte Präsentation von Produktionsfehler-Beschreibungen
Zusammenfassung Im Projekt CeraNet wurde ein System entwickelt, das Informationen über Fehlerursachen und Fehlerphänomene bei der Keramikproduktion im Web präsentiert. Zentrale Idee von CeraNet ist die Modellierung der Prozesse und die Verknüpfung der Fehlerbeschreibungen mit den Modellen, um einen Zugang zu den Fehlern auch über die Prozesse zu ermöglichen. In CeraNet wurde eine Redakteurssoft...
متن کاملEin XML-basiertes Datenbanksystem für digitale Wörterbücher - Ein Werkstattbericht aus dem Institut für Deutsche Sprache (An XML-Based Database System for Online Dictionaries - A Report on Lexicographic Work at the Institute for German Language)
Zusammenfassung Das Online-Wortschatz-Informations-system Deutsch (OWID) ist ein digitales Wörterbuchportal des Instituts für Deutsche Sprache. Alle darin zusammengeführten lexikografischen Daten sind auf XML-Basis feingranular struk-turiert. Speicherung, Verwaltung und Retrieval dieser Daten übernimmt das Oracle-basierte Electronic Dictionary Administration System (EDAS). Der vorliegende Beitr...
متن کاملXML als Basistechnologie für das Content Management integrierter Medienprodukte
Die Medienindustrie befindet sich derzeit in einer technisch induzierten Umbruchphase. Neben die klassischen Medien wie etwa Print und Rundfunk treten die neuen, auf digitalen Technologien beruhenden Medien wie etwa das Internet und das digitale Fernsehen. Die durchgehende Digitalisierung bei der Erzeugung, Bündelung und Distribution von Inhalten ermöglicht dabei vielfältige Ansatzpunkte zur In...
متن کامل